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Résumé. Cet article adresse le problème de traitement approximatif sur les re- 

^} ■ quêtes flexibles de la forme SELECT-FROM-WHERE-GROUP BY avec join- 

ture et propose un cadre flexible pour ISaggregation en ligne favorisant le temps 
de réponse au détriment de Inexactitude du résultat. 
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Q. 

</5 ■ 1 Introduction 

Les requêtes approximatives (RA) représentent une solution pertinente qui permet d'amé- 
liorer le temps de réponse aux dépens de l'exactitude. Celles-ci sont adaptées aux requêtes 
avec agrégats pour lesquelles la précision au dernier décimal n'est pas exigée. La contribution 
de ce travail est le calcul en ligne de l'agrégation pour les requêtes flexibles ave c groupemen t 
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^ ! 2 Agrégation en ligne des requêtes flexibles avec groupement 

d'attributs et jointure 

La première de notre approche consiste à générer la base de connaissances (BC) à partir de 
la base de donnée s (BD). Elle est assurée par_une procédure de classification non supervisée 



d'attributs et jointure en se basant sur l'Analyse Formelle de Concepts (AFC) de IWilld (1 1 9821) 

et le formalisme des sous-ensembles flous 



Sassi et al.l (120 121) sur les attributs relaxables^. La deuxième phase comporte deux étapes. La 



première est une réécriture de la requête qui aura la forme suivante d'une RA : 

SELECT Fonctionf Attribut), Degré Confiance As Confidence, 

Fonctionlnterval(DegréDeConfiance) FROM Tables 

WHERE Attributl IS ConditionFlexible 1 [And Attribut2 IS ConditionFlexible2...] 

And Table 1 .attribut=Table2. attribut... GROUP BY Table. Att ribut ; 

L'étape suivante consiste à construire un échantillon par jointure à partir de la BC. En effet, 
au lieu d'interroger toute la BC qui contient des milliers d'enregistrements, nous interrogeons 
un échantillon de la BC qui est constitué par un sous ensemble de tuples de la BD, ce qui permet 



1. Attributs que les utilisateurs peuvent utiliser dans un prédicat de comparaison contenant un terme linguistique. 



d'améliorer le temps de réponse. Cet échantillon sera transformé en un treillis de concepts, 
noyau de FAFC, qui sera la clé du parcours et du calcul de la fonction d'agrégation ainsi que 
du taux d'erreur de cet échantillon. P our le calcul de l'a grégation, nou s adoptons les fonc tions 



d'agrégation définies initialement par lHaas et al.l (119991) et étendus par lSassi et al.l 020121) 



3 Évaluation 

Nous avons utilisé un exemple de jeu de données qui gèrent un ensemble de patients afin 
d'étudier les facteurs de risque d'athérosclérose. Considérons la requête suivante "Lister le 
nombre de décès régulièrement alcooliques des patients scolaires par année". Les expérimen- 
tations faites prouvent que l'approche proposée favorise le temps de réponse au détriment de 
l'exactitude du résultat obtenu suite à une requête flexible. La figure Q]présente la variation du 
nombre de patients par rapport au temps de réponse. 




Temps de réponse (ms) sans TRA 

—*— Temps de réponse (ms) avec TRA 



FlG. 1 - Comparaison entre l'interrogation flexible avec et sans traitement approximatif. 

Comme le montre la figureQ] le temps de réponse sans TRA est de l'ordre de 6 secondes 
(6000ms), tandis que, avec TRA, est de l'ordre de 2 secondes (2000ms). Pour tester l'exactitude 
de la réponse, nous extractions les valeurs exactes de la BD et nous les comparons avec celles 
obtenues par notre approche. Les résultats obtenus prouve l'efficience de l'approche proposée 
dans l'exactitude des réponses retournées. 
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Summary 

This paper addresses the problem of approximate processing for flexible queries in the form 
SELECT-FROM-WHERE-GROUP BY with join condition. It offers a flexible framework for 
online aggregation while promoting response time at the expense of resuit accuracy. 



